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开放 数据 计量 研究 综述 :计算 网 络 用 户 行为 
和 科学 社 群 影 啊 力 的 Altmetrics 计量 


顾 立 平 
(中 国 科学 院 国 家 科学 图 书馆 ”北京 100190) 


【摘要 】 简 要 介绍 Altmetries 利用 社会 网 络 使 用 数据 来 推荐 信息 检索 排名 次 序 以 及 与 其 他 影响 指标 改变 学 术 评价 
方式 的 优势 。 经 过 案例 观察 分 析 ,描绘 Altmetries. com 的 开放 数据 框架 ,特别 是 它 对 论文 级 别 计量 的 专业 服务 。 
着 重 分 析 两 篇 可 以 提升 实证 检验 方法 的 核心 文章 ,形成 简要 的 可 操作 的 工作 流程 ;讨论 开放 存储 、 开 放出 版 支持 
洁 新 的 舱 入 研究 团队 的 信息 服务 等 图 书馆 新 的 知识 服务 议题 。 

5 关键 词 】 蔡 代 计 量 ”影响 测度 ”使 用 网 络 引用 网 络 社会 网 络 开放 科研 数据 ”论文 级 别 计量 
0 分 类 号 】G250 


Reviews of the Open Data Metric Studies: An Alternative Metric 
( Altmetrics) for Calculating the Online User Behavior and the 
Scientific Community Impact 


Ku Liping 
( National Science Library, Chinese Academy of Sciences, Beijing 100190, China) 


[Abstract] This paper introduces what the advantages of Altmetrics that by using the social network usage data to recom- 
mend the information retrieval ranking order and with the other impact index to change the scholar evaluation approach. By 
using the case observation analysis, the author draws — up the open data framework of the Altmetrics. com, focuses on its 
specialized service for the Article — Level Metrics. For discussion on the library new knowledge service issue in the open 
repository, open publishing supporting and the new research — group — embed information service, the two core articles 
which can improve the empirical validation method are simplified as a brief operational workflow. 

[Keywords] Alternative metrics Impact measure Usage network Citation network Social network 
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1 Altmetrics 的 特性 和 优势 


1.1 学 术 交 流体 系 的 变化 与 Altmetrics 的 优势 
科技 信息 学 术 交 流体 系 ,已 经 向 开放 获取 、 开 放 知识 和 开放 创新 的 方向 前 进 ,对 知识 服务 提出 了 更 高 的 要 求 
和 挑战 。 新 的 开放 知识 服务 模式 ( Open Knowledge Services) 包括" :将 图 书馆 作为 支持 用 户 创新 的 平台 ,以 及 经 过 
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发 现 、 六 选集 成 和 提供 开放 资源 .开放 分 析 工 具 .个 性 
化 组 织 与 管理 政策 整合 规划 等 ,将 图 书馆 发 展 为 开放 
的 公共 知识 服务 创新 平台 。 因 此 ,图 书馆 需要 积极 掌 
握 各 种 分 析 和 入选 工具 ,实施 各 种 参与 开放 科学 的 实 
BTE. 

近期 ,一 种 开放 数据 计量 服务 Altmetrics 正在 悄然 
崛起 , 它 的 别称 Alternative Metrics 或 可 译 为 “另类 计 
量 " 或 者 “替代 计量 "” Piwowar” Ai ERA 4 种 洪 在 
优势 : 

(1) 提供 更 为 细致 的 影响 力 分 析 , 如 同 引 用 数据 
一 般 , 学 术 产 出 的 阅读 、 讨 论 存储 和 评论 都 可 被 计算 。 

(2) 提供 实时 更 新 的 数据 ,可 以 评估 一 天 而 不 是 
一 年 的 影响 力 。 

(3) 网 民 对 学 术 产 出 的 影响 ,例如 数据 集 、 软 件 、 
博客 视频 等 。 

(4) 受 到 各 种 不 同 受 众 的 影响 ,包括 学 者 .从 业 人 
员 ,临床 医生 教育 家 和 一 般 大 众 。 

Altmetric. org 显示 4 种 不 同 的 评 量 方法 ,如 图 1 
所 示 : 


影响 力 
会 4 ^ 4 


使 用 同行 评审 引用 Alt-metrics 
下 载 专家 意见 
阅读 链接 

标签 

评述 


图 1 4 种 不 同 的 评 量 方法 人” 


其 中 “使 用 ”是 指 来 自 数据 库 商 、 学 术 信 息 集成 
商 \ 开 放 机 构 知 识 库 的 统计 内 容 ;“ 同行 评审 ”是 指 由 
评论 ,注释 形成 的 众 包 (Crowdsource) 专家 意见 ;“ 引 
用 ”是 指 根据 文 末 参 考 文献 进行 的 各 种 影响 因子 分 析 
以 及 学 术 ( Academy ) 以 外 的 各 种 引用 ;“ Alt — metrics” 
则 是 Web2.0 方式 下 的 统计 数据 。 

在 新 型 学 术 交 流体 系 中 , 同行 评议 不 仅 只 有 已 经 
刊 出 的 期 刊 论文 ,广泛 含义 下 的 同行 评议 ,也 包括 前 出 
版 (Pre - Publication ) 和 后 出 版 (Post — Publication ) 的 过 
程 。 例 如 类 似 arX. org 的 服务 ,作为 支持 开放 学 术 交流 
体系 和 支撑 开放 学 术 出 版 的 开放 存储 系统 ,在 物理 、 数 
学 .计算 机 、 计 量 生 物 、 统 计 等 领域 具有 广泛 影响 “|。 
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因为 开放 资源 工具 是 为 了 支持 不 同 用 户 进 行 协 调 合 
作 , 所 以 为 科研 和 教育 领域 的 从 业 人 员 提 供 了 新 的 机 
遇 。 如 何 深入 了 解 技 术 、 如 何 运 用 技术 解决 政策 问题 
以 及 如 何 运用 政策 指导 开放 科学 的 健全 发 展 ,都 是 这 
个 时 代 的 新 挑战 ”。 在 这 种 背景 下 ,Altmetrics 提供 了 
另 一 种 计算 网 络 用 户 行为 和 观察 学 术 圈 影响 力 的 视 
角 , 其 机 理 值得 深入 研究 。 
1.2 Altmetrics 的 特性 

有 别 于 传统 评价 科研 成 果 的 引用 计量 ( Citation 
Metrics) , Altmetrics 具有 更 为 广泛 的 同行 评审 的 特性 。 
它 将 社会 媒体 、 社 会 标签 ,社会 网 络 、 社 群 网 站 等 的 用 
户 行为 , 包括 浏览 下 载 . 评 论 . 标 引 、 注 释 等 , 均 视 作 
一 种 可 供 计 算 的 用 户 使 用 数据 ( User Usage Data) 。 
Neylon 等 上 9 认为 论文 级 别 计量 ( Article — Level Metrics, 
ALMs ) 可 以 提供 特定 项 目 . 来 自 不 同类 型 学 术 影响 的 
最 新 消息 ,可 以 帮助 研究 人 员 筛 选 信息 ,以 更 快 更 轻松 
的 方式 找到 相关 的 研究 。 这 种 新 型 的 学 术 交 流 模 式 也 
受到 Altmetries 的 支持 。 从 科研 价值 评 量 的 角度 来 看 ， 
学 术 交 流 的 表达 方式 越 来 越 多 样 ,Priem 等 ”认为 Alt- 
metrics 可 以 组 织 开 放 数 据 并 且 呈 现 直观 的 可 视 化 
内 容 : 

(1) 分 享 数据 集 、 代 码 和 实验 设计 的 “原生 /原始 / 
HP” (Raw Science), 

(2) 发 布 参数 或 者 语义 内 容 而 非 整 篇 文章 。 

(3) 以 博客 , 微 博 和 评论 在 既 有 工作 上 进行 批注 等 。 

本 文 分 析 Altmetrics 的 数据 模型 框架 ,并且 在 前 期 
建立 专利 排名 算法 ”及 知识 元 库 ” 等 的 基础 上 ,经 过 
文献 调研 ,梳理 其 计算 原理 。 在 数据 模型 和 计算 原理 
的 基础 上 ,梳理 最 新 有 关 Altmetrics 的 文献 内 容 ,简要 
归纳 图 书馆 应 用 Altmetrics 实施 开放 获取 、 开 放 知 识 和 
开放 创新 等 情报 服务 的 方式 。 


2 Altmetrics 的 开放 数据 模型 


在 Altmetrics. org 之 后 ,提供 商业 服务 的 Altmet- 
rics. com 对 开放 数据 模型 进行 深度 开发 ,形成 具有 器 
越 平台 ,进行 多 源 ( 不 同 数据 来 源 ) 多 向 (不 同 数据 推 
送 ) 多 重 (不 同 数据 服务 ) 的 动态 的 功能 集结 系统 (不 是 
静态 的 系统 整合 功能 ) , 价 入 到 信息 出 版 商 、 集 成 商 、 系 
统 商 数据 供应 商 和 共享 组 织 等 的 具体 作用 中 。Altmet- 
rics. com"! 显示 操作 Altmetrics 的 方式 ,如 图 2 所 示 。 


1. 在 书签 工具 栏 加 入 书签 标记 

2. 访问 任何 文章 

3. 点 击 可 得 论文 级 别 
计量 的 分 析 结果 


图 2 操作 Altmetrics ds 


2.1 社会 网 络 数据 的 开放 数据 存储 与 接口 

Altmetries 可 以 针对 论文 .网 站 、 博 客 、 数 据 集 、 灰 
色 文 献 软件 等 ,进行 各 种 社会 软件 的 网 络 用 户 行为 计 
量 。Konkiel'" 表示 :阅读 ( Viewed ) , F zX; ( Download- 
ed) .引用 (如 PubMed, CrossRef, Scopus, Wikipedia, 
DOI, Web of Science) 、 重 用 (如 GitHub ) 共享 (如 
Facebook, Twitter) 、 标 引 ( 如 Mendeley, CiteULike, De- 
licious) 评论 (如 Twitter, Mendeley, Blogs, Publisher 
Websites, Wikipedia) 等 均 可 被 Altmetries 计算 。 所 以 ， 
它 的 运行 机 制 主要 依赖 社会 软件 所 提供 的 开放 数据 。 

进入 Altmetries 数据 库 中 的 所 有 外 部 API 都 通过 
IP 进行 控制 。 对 于 进行 特殊 应 用 或 者 长 期 大 量 数据 传 
输 的 用 户 、 以 及 个 别 采 用 混搭 / 汇 融 (Mash - up) 或 者 
应 用 程式 界面 的 机 构 , 可 以 申请 参数 名 称 。 申 请 之 后 ， 
会 得 到 一 个 密 钥 (Key ) ” ,如 : “http://api. altmetric. 
com/v1/id/241939? key 2 xxx" , 
2.2. 开放 数据 的 系统 交互 性 

如 果 分 析 层 次 在 单 篇 论文 , 则 必须 根据 一 套 具 体 
的 机 械 可 读 的 标识 符 ,确定 该 篇 论文 或 者 数据 集 的 有 
效 指 涉 对 象 。 在 Altmetrics 中 给 出 5 种 常见 通用 的 ID 
S3 777 ,整理 如 表 1 所 示 。 查 询 其 中 一 种 ,理论 上 
可 以 同时 获得 另外 4 种 。 

表 1 在 Altmetrics 的 5 种 ID 参数 


ID 标准 常见 的 数据 中 心 在 Altmetric 的 范例 
Altmetric n http ;//api. altmetric. com/vl/id/ 
Article ID] ies 241939 

r http ;//api. altmetric. com/v1/doi/10. 

[14] ataCi p: p 
DOL BIAIS 1038/news. 2011. 490 

http ://api. altmetric. com/vl1/pmid/ 
[15] PubMed p: p F 
PubMed ID ubMed 21148220 
http ://api. altmetric. com/v1/arxiv/ 
aX; [16] APYTS- OW p ://ap 
arXiv ID arXiv. org 1108.2455 
NASA http ;//api. altmetric. com/v1/ads/ 


nci 17] stri ics 
ADS Bibcode Astrophysics 2012apphl. 10053104b 
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在 Altmetrics 数据 库 中 ,系统 自动 生成 的 唯一 标识 
符 是 Altmetric Article ID ,也 是 标识 指 涉 对 象 (Object ) , 
如 一 篇 文章 的 具体 编号 ,由 于 通过 数据 传输 ,而 取得 来 
自 DataCite , PubMed , arXiv. org 等 开放 存储 的 开放 数 
据 , 因 此 Altmetric 将 各 种 ID 对 应 到 Altmetrie ID 上 , 实 
施 统 一 知识 元 库 ( Unified Knowledge Base) 的 管理 。 

根据 D 参数 ,可 以 获得 文章 或 者 数据 集 的 反馈 指 
涉 对 象 (Response Object ) 和 其 他 参数 ( Parameters ) 


2 


2.3 ”论文 级 别 计量 的 开放 数据 

在 参数 中 ,包括 4 种 主要 数据 架构 : 指 涉 对 象 的 类 
型 (identifier type) JEW XTZ (identifier ) ,资源 (include 
_sources ) 和 章节 片段 (include_sections ) H8] o Altmetrics 
在 include, sections 这 个 层次 对 引号 .引文 .记分 .统计 、 
短信 等 进行 区 分 ,充分 发 挥 可 计算 性 和 开放 数据 的 特 
性 。 事 实 上 ,这 个 include. sections 层次 中 的 实际 内 容 ， 
就 是 反馈 指 涉 对 象 (Response Object) 的 具体 信息 ,也 
是 研究 Altmetrics 数据 模型 的 关键 。 笔 者 整理 如 表 2 
Bim, 


«lin. 


X2 开放 数据 的 ALM 细节 


BE 具体 内 容 
在 Alimetries 中 的 识别 符 和 指 涉 对 象 编号 ,另外 4 种 
匀 以 此 为 转换 标准 。 

EJH PubMed 的 数据 模型 ,包括 :标识 版 本 的 统一 识 
别 符 (unique_ips) 、 全 文 总 数 (full_text) , 下载 PDF 数 
(pdf) .摘要 读数 (abstract ) ,每 月 检查 一 次 的 时 效 
counts (timeline) 。 
其 他 开放 数据 可 以 来 自 : 推 客 、 脸 书 、 谷 歌 ,博客 、 新 
闻 „pinterest , reddit , q&a .评论 .misce( 任 何 可 取 的 形 
式 ) 等 。 


HJH DataCite 的 数据 模型 ,包括 :时 间 框 架 (tme- 
frame) 、 页 数 (page) 每 页 包括 的 篇 数 (num_results) 、 
引用 数 (in Cited 来 自 facebook, blogs, twitter, reddit, 
news, f1000, rh, qna, forum 等 的 记录 ) 数字 资源 唯 
一 标识 符 的 前 级 ( doi_prefix) ,来自 期 刊 编码 的 符号 
(nlmid) .来自 期 刊 所属 的 学 科 (subject) 等 。 


altmetric_id 


selected. quotes 


first, seen. on( 在 Altmetrics 第 一 次 共享 或 提 及 的 这 篇 
文章 的 日 期 ) ,altmetric_jid( 关 于 日 志文 章 的 内 部 数 
据 库 标识 符 , 与 altmetric_id 不 同 ) ,links (链接 这 个 版 
本 的 文章 的 URL) 。 


citation 


当前 记分 (score) ,根据 不 同时 间 段 的 记分 (score_his- 
tory) , TE. Altmetric 数据 库 中 的 积分 (context_for_ 


score), 


H 


altmetric, score 


不 是 圈 内 的 公众 (member of the public) .有关 的 研究 
A (researcher) ,在 临床 科学 的 研究 者 (practitioner) , 
科学 传播 者 (science communicator) 。 


demographics 


分 借用 NISO 的 数据 模型 ,包括 :标题 (tile) ,摘要 
summary 实际 上 为 第 一 段 内 容 ) .链接 位 置 (url) 、 创 
E H 39] ( posted. on) ,作者 配置 文件 (author)。 


posts 
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值得 注意 的 是 altmetric _score 中 的 context_for_ 
score 项 中 的 细节 。 因 为 终端 用 户 最 后 在 API 上 直接 
看 到 的 数据 ,来 自 altmetric_score 的 成 分 最 多 ,而 且 它 
的 混合 计算 又 较为 复杂 ,所 以 重点 在 于 这 类 数据 数值 
从 何 而 来 。 为 求 方便 理解 ,笔者 将 其 区 分 为 两 大 类 : 

(1) 在 数据 计算 (all ) 方 面 ,在 Altmetrics 数据 库 中 
的 统计 数字 ,包括 :平均 值 (mean, 即 所 属 数据 集 内 的 平 
均 数 量 ) 样本 量 (sample_size) \ 拆 分 值 (split, 第 一 条 


计量 (Journal - Level Metrics, JLMs) 具 有 很 大 程度 的 差 
异 : 受 众 不 同 ,公众 和 学 者 往往 关心 的 重点 不 同 ;维度 
不 同 ,在 影响 力 、 关 注 力 、 自 我 提升 等 方面 ,发 展 科研 评 
量 以 促进 科研 发 展 的 方式 和 角度 有 所 不 同 ;时 间 节 点 
不 同 ,期 刊 评价 以 年 度 为 单位 ,而 Altmetries 等 可 以 计 
算 到 月 份 和 当日 。 这 些 特性 使 得 Altmetrics 能 够 协助 
ALMs 进行 更 为 “细致 "和 “精密 ”的 计算 。 

整个 验证 步 又 可 以 分 为 :社会 网 络 计 量 与 期 刊 引 


件 是 数据 集中 的 最 高 分 ,第 二 条 件 是 90% 中 的 最 高 
分 ,第 三 条 件 是 80% , 往 后 条 件 以 此 类 推 )、 相 同 或 者 
低 于 这 篇 文章 的 文章 数 (this_scored_higher_than) , Er 
占 排名 的 百分比 (this_scored_higher_than_pct)。 
(2) 期 刊 计算 方面 ,包括 三 种 类 型 :所 有 在 这 份 期 
刊 中 的 论文 的 统计 信息 (this_journal) ;在 6 周 内 的 同 
样 一 份 期 刊 中 ,与 此 论文 有 关 的 统计 信息 (similar_age_ 
this_journal_3m) ;在 6 周 内 的 任何 期 刊 中 ,与 此 论文 有 
关 的 统计 信息 (similar_age_3m) 。 
第 一 种 是 在 整个 数据 库 中 ,针对 单 篇 论文 ,运用 所 
有 论文 的 数据 ,进行 ALMs 计算 ;第 二 种 是 围绕 期 刊 进行 
JLMs - ALMs 计算 ,针对 单 篇 论文 ,运用 与 之 相关 的 期 二 
的 所 有 论文 ,进行 ALMs 计算 。 区 分 这 两 种 计算 的 意义 
在 于 ,能 够 认识 到 Altmetrics 的 计算 原理 。 因 为 对 终端 
用 户 , 如 一 般 浏 览 论文 的 读者 而 言 (例如 他 阅读 《Na- 
ture》 某 篇 介绍 转基因 最 新 发 展 的 会 议 文章 或 者 演讲 视 
频 ) ,第 一 种 显然 是 Altmetrics 与 众 不 同 的 推荐 服务 内 


一 


用 计量 的 差异 性 或 者 趋同 性 ,以 及 开放 存储 下 载 与 开 
放 注 释 评价 的 差异 性 或 者 趋同 性 。 文 献 [22 ] 从 JLMs 
的 角度 文献 [23] 从 ALMs 的 角度 分 别 对 此 进行 验证 ， 
本 文 予 以 合并 简化 , 详 述 如 下 。 
3.2 指标 趋同 验证 

Bollen 等 ”从 不 同 数据 中 心 收集 开放 数据 ,主要 
包括 :期 刊 引用 数据 、 期 刊 引文 网 络 、 使 用 日 志 数 据 。 
根据 39 种 科学 影响 力 指标 ,建立 包括 :引文 网 络 、 排 名 
算法 、 使 用 网 络 .社会 网 络 等 4 类 测量 指标 。 将 指标 与 

首 标 相对 ,运用 Spearman 38 fr HOS R 和 矩阵 ,会 产生 一 

个 相关 矩阵 (39 x39) ,利用 主 成 分 析 法 (Principal Com- 
ponent Analysis, PCA ) 产生 层次 聚 类 分 析 图 ( Hierarchi- 
cal Cluster Analysis, HCA ) 以 及 方差 比例 (Proportion of 
Variance ) 和 累积 比例 (Cumulative Proportion ) 。 

在 PCA 之 后 ,是 在 HCA 图 上 ,寻找 合适 的 聚集 
( Cluster) ,以 帕 累 托 原则 (Pareto Principle)( 即 “二 八 原 
则 ”) 进行 判断 。 最 后 ,在 新 的 坐标 图 上 ,标明 39 种 指 


容 。 但 是 ,对 于 若干 学 科 专 家 而 言 (例如 他 阅读 "去 氧 核 
糖 核酸 酶 的 结构 ”的 理论 文章 ) ,由 于 学 科 内 容 过 于 精 
细 , 需 要 以 期 刊 群 组 内 的 数据 进行 计算 ,才能 体现 某 篇 文 
章 在 学 术 圈 内 的 价值 。 而 且 , 更 为 重要 的 是 ,人 们 如 果 获 
得 第 二 种 数据 ,可 以 对 比 “ 基 于 ALMs 的 JLMs” 和 “一 般 
JLMs” 的 异同 ,例如 对 比 基 于 传统 文摘 数据 库 的 期 刊 影响 
力 与 基于 Altmetrics 的 期 刊 影响 力 两 者 之 间 的 异同 。 

此 外 ,在 demographics 和 posts 中 运用 到 型 人 (Per- 
sonas ) 的 概念 ,人 们 可 以 用 来 筛选 数据 ,也 可 以 用 来 区 
分 不 同 用 户 群 组 后 ,给 予 不 同 的 加 权 数 值 。 本 文 省 略 
这 部 分 的 讨论 。 


3 检验 Altmetrics 的 实证 方法 


3.1 实证 验证 的 思路 
Lin 等 2 认为 文章 级 别 计量 (ALMs ) 与 期 刊 级 别 
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标的 对 应 位 置 ,就 得 到 聚集 (Cluster) 。 

Bollen 45 7" 的 研究 从 实证 检验 方法 ,暂时 证 明 期 
刊 引 用 数据 和 用 户 使 用 数据 的 趋同 性 , 即 根据 使 用 数 
据 所 得 的 排名 和 根据 期 刊 引用 数据 所 得 的 排名 在 方向 
上 是 趋 于 一 致 的 。 此 外 ,不 论 是 第 一 中 心 点 还 是 第 二 
中 心 点 , 均 包 括 以 PageRank 作为 方法 组 成 核心 的 指 
标 。 所 以 , 据 此 可 以 开发 一 系列 更 为 准确 的 文献 相关 
性 推荐 或 者 学 术 贡 献 排 名 等 。 

3.3 时间 延 异 验证 

如 果 期 刊 引文 计量 和 用 户 行为 计量 , 均 对 高 质量 
和 高 影响 的 论文 所 组 成 的 期 刊 评价 具有 一 致 或 者 相似 
的 评 量 结果 。 那 么 ,在 用 户 行为 计量 方面 ,传统 使 用 统 
计数 据 (浏览 下 载 . 点 选 等 ) 和 新 型 使 用 统计 数据 ( 标 
引 \ 评 论 ,注释 等 ) 的 举动 ,是 否 具有 趋同 性 ,是 为 关键 。 
另外 ,在 ALMs fil JLMs 的 根本 性 差异 中 ,第 三 项 <“ 时间 


节点 ”的 差异 是 否 对 排名 结果 造成 影响 ,也 很 重要 。 
Shuai 4&? 从 arXiv. org 和 Twitter 各 自 获得 两 种 好 
异 的 开放 数据 , 即 一 篇 文章 发 布 后 ,在 arXiv. org 的 下 
载 情 况 ( Downloads ) 和 在 Twitter 的 引述 情况 ( Men- 
tions)。 论 文 从 提交 (Submission) 到 下 载 /引述 高 峰 的 
时 间 ,是 论文 被 延迟 (Delay ) 关注 的 时 期 ,而 论文 从 提 
交 到 下 载 / 引 述 高 峰 , 再 到 逐渐 减低 至 无 人 关注 的 时 
期 ,是 整个 跨度 日 期 (Span)。 据 此 形成 三 种 函数 :在 
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(1) 提 供 传 统 学 术 履 历 表 以 外 的 其 他 信息 ; 
(2) 降 低 不 恰当 的 衡量 标准 ; 
(3) 揭露 那些 上 只 是 为 了 出 版 而 出 版 的 工作 ; 

(4) 使 所 有 类 型 的 学 术 产 品 合法 化 ; 

(5) 认 识 到 各 种 影响 偏好 (不 同 的 受众 观点 ) ; 

(6) 奖 励 能 够 提供 他 人 重用 的 实质 努力 ; 

(7) 鼓 励 公 众 参 与 ; 

《8) 促 进 定性 探索 ( 原 " 量 化 "计量 方法 ,不 太 适 合 


Twitter 的 引述 数量 ;在 arXiv. org 的 下 载 数量 ;从 发 布 
日 到 分 析 日 的 天 数 。 根 据 三 种 函数 建立 三 项 多 元 线性 
回归 模型 ,再 比较 三 者 的 标准 差 (Standard Error) ,选择 
最 优 相关 性 ,进行 皮尔 森 相 关系 数 R 测量 。 

Shuai 等 ”的 研究 成 果 能 够 让 人 们 直观 地 看 到 开 
放 存 储 下 载 与 开放 注释 评价 的 趋同 性 , 即 随 着 时 间 推 
移 , 人 们 关注 度 的 增加 和 减少 ,以 及 两 种 使 用 统计 ( Us- 
age Statistic ) 在 时 间 轴 上 趋 于 一 致 方向 的 情况 。 
3.4 ”验证 模型 未 考虑 的 情况 

断 刊 散 刊 . 合 刊 单 独 论文 .论文 的 单独 章节 等 情 
况 , 没 有 在 这 个 验证 模型 中 考虑 。 然 而 由 于 AMLs 的 
特性 ,不 能 排除 这 几 种 “例外 ”情况 的 统计 分 析 , 因为 
它们 实际 上 在 Altmetries 中 也 在 进行 各 种 数值 呈现 的 
推荐 服务 。 目 前 ,为 求 简化 ,集中 探讨 了 引文 网 络 与 使 
用 网 络 ,以 及 传统 使 用 统计 与 新 型 使 用 统计 等 ,没有 被 
纳入 验证 模型 之 中 的 部 分 ,未 来 理应 纳入 计算 。 

借用 Bollen 45 7" 和 Shuai 等 1 所 提供 的 方法 和 了 验 
证 结果 ,几乎 可 以 确立 各 种 指标 具有 趋同 性 ,而 且 各 种 
用 户 行为 数据 ,所 呈现 的 关注 度 发 展 ,也 趋 于 一 致 。 在 
此 基础 上 ,适当 开展 关于 图 书馆 如 何 运用 Altmetrics 或 
者 利用 相同 原理 开展 新 的 服务 , 变 得 稳定 可 靠 。 


4 图 书馆 应 用 Altmetrics 的 探讨 


4.1 对 图 书馆 服务 对 象 的 影响 

Alperin ”认为 :对 发 展 中 国家 而 言 , 这 些 国家 地 
区 的 经 济 .政治 和 技术 条 件 与 北美 和 欧洲 地 区 不 同 ,这 
些 社会 需要 学 术 社 群 关 心 的 议题 也 有 所 不 同 ,而 Alt- 
metrics 的 出 现 ,可 以 提供 一 种 适当 平衡 公共 需求 和 学 
术 贡 献 的 平台 。 学 术 圈 内 ,一 向 重视 学 术 资 历 , 过 去 往 
往 以 发 表 期 刊 论文 或 者 学 术 专 著 为 主 ,也 有 若干 专利 、 
项 目 或 者 会 议 发 言 等 。Piwowar 5&7" jA Jg Altmetrics 
将 对 学 者 履历 产生 10 种 影响 : 


定性 研究 ,但 是 发 布 一 篇 定性 研究 内 容 , 现 在 通过 Alt- 
metrics 可 以 产生 许多 量化 使 用 统计 数据 ) ; 

(9) 健全 科研 成 果 发 布 的 多 重 选 择 性 ; 

(10) 刺激 科研 评价 的 创新 。 

学 者 个 人 履历 不 只 是 把 著作 列表 贴 在 网 页 上 ,而 
是 时 时 刻 刻 在 更 新 这 些 列表 的 “学 术 贡 献 ” ,包括 引文 
和 使 用 两 种 数据 的 综合 得 分 。 此 外 ,通过 Facebook 和 
Twitter 等 的 推荐 机 制 ,还 能 够 为 学 者 自动 组 织 对 同一 
个 主题 都 感 兴趣 的 虚拟 研究 社 群 。 

基于 Altmetrics 的 学 者 个 人 履历 已 经 逐渐 成 为 应 
聘 、 升 职 和 证 明 学 界 地 位 的 一 种 方式 ,因此 图 书馆 员 可 
以 利用 这 类 数据 或 者 分 析 方 式 , 进 行 深度 学 科 化 服务 
咨询 工作 ,为 学 者 专家 类 型 的 用 户 ,进行 如 何 使 用 和 提 
J| Altmetrics 的 服务 。 
4.2 ”对 图 书馆 租 选 开放 获取 期 刊 的 影响 

开放 获取 与 Altmetrics 殊途同归 。 由 于 开放 获取 
期 刊 容易 被 更 多 人 使 用 ,使 得 它们 被 更 多 人 引用 , 然 
而 ,使 用 文献 的 方式 并 不 仅仅 是 在 另 一 篇 文献 的 参考 
注释 中 标注 ,使 用 文献 信息 还 可 以 是 链接 .评论 .引文 、 
注释 .讨论 .保存 以 及 其 他 交互 。Mounce 认为 :作为 
能 够 进行 即时 同行 评审 的 Altmetrics 可 以 为 开放 获取 
期 刊 提供 带 来 正面 效益 , 像 是 从 非 科 学 家 ( Non - Sci- 
entists ) 中 获得 大 量 评价 数据 ,并 且 能 够 促使 后 出 版 
( Post - Publication ) 的 信息 过 滤 (Information Filter ) 更 
加 容易 和 准确 等 。 

传统 的 学 术 评价 方式 ,是 根据 纸 本 期 刊 中 的 纸 本 
论文 中 的 参考 文献 列表 ,计算 一 本 期 刊 在 2 到 5 年 内 
被 引用 的 情况 ,然后 根据 引用 数值 的 高 低 进行 期 刊 排 
名 ,最 后 形成 学 者 优先 投稿 哪些 期 刊 的 参考 依据 ,并 据 
此 形成 评价 学 术 质 量 高 低 的 排名 。 这 是 一 套 “ 自 圆 其 
说 ”的 理论 ,但 是 也 冒 着 “套套 逻辑 ”的 风险 。 

开放 获取 期 刊 论文 内 容 (Content) 的 开放 程度 , 包 
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括 : 可 检索 .可 获取 可 使 用 .可 计算 等 不 同 开放 程度 ， 
Altmetrics 不 是 参考 前 几 年 的 期 刊 论文 的 引文 数据 ,而 
是 这 几 年 包括 此 刻 当 下 的 各 种 被 使 用 情况 的 综合 数 
据 。 如 此 一 来 ,就 摆脱 了 上 述 传统 评价 模式 中 的 套套 
逻辑 ,而 是 更 加 完整 地 呈现 学 术 质 量 评估 的 机 制 。 


献 和 社会 贡献 。 
4.4 对 图 书馆 的 情报 分 析 服务 的 影响 

从 1960 年 以 来 ,引文 数量 (Citation Counts ) 一 直 作 
为 判断 学 术 贡 献 和 质量 状态 的 标准 ,但 引文 分 析 ( Cita- 
tion Analysis) 越 来 越 多 的 问题 (如 时 效 有 限 、 自 我 引 


为 评价 结果 是 时 刻 变 化 的 ,所 以 学 术 评 价 是 动态 的 而 
不 是 静态 的 ,这 样 更 加 符合 开放 获取 期 刊 的 特性 ,能 
随时 被 人 所 用 ,并 且 即 时 反应 出 来 。 

因此 ,图 书馆 界 在 支持 开放 获取 期 刊 发 展 时 ,势必 
考虑 到 利用 Altmetrics 或 者 类 似 方式 ,进行 期 刊 评价 与 
txt T. fr. 
4.3 ”对 图 书馆 发 展开 放 知 识 库 的 影响 

对 于 机 构 知识 库 而 言 , 作 为 线 上 活动 价值 指标 的 
Altmetrics 能 够 带 来 更 多 发 展 空间 ,将 搜索 .浏览 .社会 
媒体 .受众 标 引 数据 重用 等 的 开放 机 构 知识 库 的 优势 
扩大 。 而 且 , 机 构 知 识 库 为 学 术 圈 产 生 的 贡献 不 是 排 
名 或 者 比较 ,而 是 重新 审视 资源 中 的 相关 性 ,促进 检索 
效率 和 更 为 广泛 的 内 容 使 用 。Konkiel 等 ”认为 它 对 
作者 的 价值 体现 在 : 

(1) 帮 助 作者 更 好 地 了 解读 者 使 用 开放 获取 内 容 
的 行为 。 

(2) 作 为 期 刊 影响 因子 的 补充 ,帮助 作者 记录 它 
们 的 研究 影响 力 。 

(3) 知 识 库 管理 者 据 此 说 服 沿 未 存 缴 内 容 的 人 ， 
实行 内 容 的 开放 共享 。 

(4) 提 供 使 用 统计 以 外 的 数据 ,说 明 存储 开放 获 
取 内 容 的 平台 价值 ,与 知识 库 资 助 者 进行 更 好 的 沟通 。 

(5 ) 作 为 使 用 统计 的 补充 ,帮助 制定 采集 计划 、 资 
源 分 配 和 推广 。 

(6) 行 政 管理 者 据 此 对 内 部 和 外 部 的 利益 关系 者 
展示 机 构 的 学 术 影 响 。 

(7) 专 业 评 审 委 员 会 (职称 \ 终 生 教 职 、 来 誉 奖项 
等 ) 据 此 了 解 研究 者 实际 受到 学 术 团 体 接纳 的 程度 。 

因为 存 缴 在 开放 知识 库 中 的 论文 ,能 够 最 大 程度 
地 被 利用 和 传播 ,而 不 受到 数据 库 集成 商 的 控制 ,所 以 
开放 知识 库 发 展 类 似 Altmetries 的 功能 或 者 直接 使 用 
若干 方法 ,可 以 增强 检索 效果 统计 与 推荐 功能 、 存 缴 
内 容 被 使 用 的 维度 等 。 所 以 ,图 书馆 可 以 据 此 ,向 广大 
科研 教育 人 员 建 议 ,将 论文 或 者 科研 数据 放置 在 开放 
机 构 知 识 库 ,这 样 能 够 为 作者 带 来 更 为 广泛 的 学 术 贡 


现代 图 书 情报 技术 


用 抱团 引用 过度 受 到 重视 和 不 完整 反映 诸如 使 用 量 
等 的 情况 ) ,正好 与 Altmetrics 的 出 现形 成 强烈 对 比 ( 能 
够 计算 社会 媒体 、 社 会 网 络 、 社 群 网 站 、 社 会 标签 .博客 
论坛 .图 书馆 流通 量 、 微 博 推 客 等 ) 。 

目前 Altmetrics 正在 影响 学 术 评价 的 发 展 方向 ,但 
是 , 它 的 创新 以 及 带 来 的 改革 ,也 造成 一 些 模糊 地 带 。 
Buschman 等 ” 提出 这 些 问题 包括 :传统 期 刊 论文 势 
微 ;网 络 规模 必需 够 大 ;关注 民意 而 非 论文 (People not 
Papers ) 等 。 

是 好 是 坏 ,各 有 论述 。 然 而 , 人们 期 望 Altmetrics 
在 当前 开放 学 术 交流 体系 中 ,发 挥 更 多 的 作用 。 


5 结 语 


利用 Altmetries 能 够 帮助 发 展开 放 机 构 知 识 库 以 
及 文 持 开放 获取 期 刊 的 发 展 ,同时 研究 它 的 数据 模型 ， 
能 够 帮助 面 对 开 放 科 研 数据 的 挑战 。 它 的 计算 方法 和 
评 量 结果 ,能 够 帮助 图 书馆 员 获 得 许多 原本 不 能 得 到 
的 科研 统计 数据 ,协助 馆 员 推展 学 科 化 咨询 服务 以 及 
科技 信息 政策 咨询 工作 等 。 

面 对 各 种 可 能 带 来 的 学 术 交 流体 系 转变 , 人们 对 
于 Altmetrics 3Ef7 4 fi 4r Z8? 7 ,并 且 国际 知名 出 版 
商 Nature ” 、 内 容 集成 商 Elsevier  、 系 统 供应 商 Ex 
Libris'” 等 都 开发 了 Altmetrics 服务 ,日 本 Altas Co. 也 
已 开发 基于 ALMs 和 Altmetries 的 论文 检索 系统 。 
值得 注意 的 是 Altmetrics ( Alternative Metrics ) 和 论文 级 
别 计量 (ALMs) 的 不 同 。Tananbaum'” 定义 Altmetries 
是 融合 多 个 新 的 数据 来 源 ,用 以 测量 一 篇 论文 一 本 期 
刊 ,或 者 一 位 学 者 的 影响 力 ,而 ALMs 运用 一 些 传统 的 
(如 引用 次 数 ) 和 一 些 新 型 的 (如 推 客 微 博 ) 数 据 来 测量 
一 篇 论文 的 影响 力 。 后 续 将 对 ALMs 进行 深度 研究 。 

本 文 在 实际 分 析 开 放 数 据 模 型 和 检验 原理 的 基础 
上 ,认为 它 的 服务 方式 已 经 成 熟 ,而 且 还 在 不 断 进 步 中 ， 
图 书馆 员 可 以 开展 初步 实验 。 抛 砖 引 玉 ,是 以 为 文 。 

(致谢 :感谢 匿名 评审 老师 、 终 审 编辑 和 编辑 部 的 修改 
意见 。) 
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Data — Planet 和 EBSCO 合作 提供 统计 数据 


EBSCO 和 Data — Planet 于 近日 达成 一 项 协议 :在 发 现 服务 中 提供 统计 数据 表 信 息 , 这 是 一 大 创举 。 将 通过 EBSCO 的 发 现 
服务 EDS( EBSCO Discovery Service" ) 为 双方 的 客户 提供 Data - Planet 的 5 000 多 份 摘要 型 的 数据 记录 ,EDS 的 客户 可 直接 链 


接 到 Data - Planet 的 数据 表 。 


Data - Planet 的 统计 内 容 资 源 库 目 前 拥有 5 000 多 个 数据 集 ,以 20 多 亿 份 数据 视图 (地 图 、 趋 势 . 表 、 排 名 ) 展现。 这 些 数 
据 集 来 自信 誉 良好 的 公共 和 私人 组 织 , 覆 盖 了 16 个 广泛 的 学 科 领 域 ,包括 教育 .人 口 和 收入 .工业 \` 商 业 、 贸 易 .住房 和 建设 等 
等 。 所 有 的 数据 都 已 标准 化 、 结 构 化 ,使 用 37 个 元 数据 域 进行 描述 ,包括 :DOI、 描 述 \ 标 题 \ 地 理 实体 、 具 体 数据 元 素 , 以 及 标 


准 化 的 引文 。 用 户 可 以 访问 所 有 可 用 的 视图 ,也 可 以 下 载 。 


据 Data - Planet 总 裁 Matt Dunie 所 说 ,与 EBSCO 的 合作 是 Data - Planet 使 命 的 一 种 自然 延伸 。“ 我 们 的 使 命 是 让 统计 数 
据 更 加 容易 被 发 现 , 变 得 更 加 可 用 ,我 们 的 努力 与 发 现 服务 的 总 体 目 标 是 一 致 的 。” 
除了 可 通过 EBSCO 发 现 服 务 进行 访问 ,Data - Planet 资源 库 还 可 以 通过 男 外 两 个 接口 进行 访问 ,分 别 是 Data - Planet 统 


计数 据 集 和 Data - Planet 统计 参考 。 


与 其 他 内 容 提供 商 一 样 ,Data - Planet 和 许多 的 出 版 商 必 


F 始 与 EDS 合作 以 加 强 其 内 容 的 可 见 度 。EDS 的 合作 伙伴 包括 世 


界 上 最 大 的 学 术 期 刊 和 图 书 出 版 商 ,包括 Elsevier, Wiley Blackwell, Springer 科学 和 商业 媒体 ,Taylor & Francis Informa ,Sage 出 
版 ,自然 出 版 集团 ,IEEE,ACM 等 几 千 家 之 多 ,还 包括 一 些 内 容 提供 商 ,如 LexisNexis, Thomson Reuters , JSTOR , ARTstor , Credo 


Reference ,大 英 百 科 全 书 ,ABC - CLIO , HathiTrust 等 。 


EBSCO 发 现 服务 能 为 组 织 的 信息 资源 创建 一 个 统一 的 ` 个 性 化 的 索引 ,并 通过 一 个 单一 的 检索 框 为 组 织 的 所 有 内 容 提供 


简易 的 但 功能 强大 的 访问 。 元 数据 的 高 质量 、 以 及 元 数据 覆盖 的 深度 和 广度 保证 了 检索 功能 的 强大 。 


(编译 自 :http://homepage. data — planet. com/data — planet% E296 8496 A2. — and — ebsco — provide — mutual — customers — access — statistical — 


data — ebsco — discovery — service% E296 8496 A2.) 


ES 现代 图 书 情报 技术 


(本 刊 讯 ) 


